Mendelevium
Diary
Drug Design
Field Knowledge
Academia
Yang
Biology
Physics
Free Energy
Machine Learning & AI
Active Learning
Basics
Boltz-2
Data
Generation
Interpretability
QSAR application
Representations
Mol2Image
Workflow & Agent
Molecular Dynamics
FF & Algorithm
Small Molecule
martini
water
Interaction
Modeling & Tools
QM
Sampling & Analysis
Allostery
Fundamental
Other
Specific Sytems
Enzyme Engineering
Fiber & LLPS
Membrane
orientation_penetration
Metal
Nano Polymers
Skin Permeation
Techniques
Linux
Python
Research
Web
about
Home
Contact
Copyright © 2025 Xufan Gao | Academic Research Blog
Home
>
Specific Sytems
> Fiber & LLPS
A Bunch of Biophysics is Loading ...
Fiber & LLPS
从序列到纳米结构:FibrilGen如何让肽自组装建模变得简单
从序列到纳米结构:FibrilGen如何让肽自组装建模变得简单 本文信息 标题: FibrilGen: A Python Package for Atomistic Modeling of Peptide β-Sheet Nanostructures 作者: Chao-Yu Yang, Aline F. Miller, Alberto Saiani, Richard A. Bryce 发表时间: 2025年9月26日接收 单位: 曼彻斯特大学(英国)药学与视光学系、材料系、化学工程系 引用格式: Yang, C.-Y., Miller, A. F., Saiani, A., & Bryce, R. A. (2025). FibrilGen: A Python Package for Atomistic Modeling of Peptide β-Sheet Nanostructures. Journal of Chemical Information and Modeling, https://doi.org/10.1021/acs.jcim.5c02108 源代码: https://github.com/ChaoYuYang0/FibrilGen-v0 摘要 对于依赖肽一级序列理性设计的全新肽基纳米材料,系统性地计算建模由自组装肽形成的多样化、复杂的潜在纳米结构具有相当大的价值。本文介绍了FibrilGen,一个专门的Python工具包,能够在原子水平构建广泛的cross-β形态。FibrilGen通过一组输入的几何参数初始化肽堆积和纤维形态,随后通过精修步骤产生紧密的组装体。使用FibrilGen,研究人员可以生成各种组装的cross-β结构作为分子模拟的输入;该工具包还包括用于纤维纳米结构及其轨迹几何分析的功能。作者通过生成不同形态的cross-β纳米结构来展示该工具的实用性,这些结构与从冷冻电镜和固态核磁共振波谱确定的自组装排列高度吻合。这些结构在水溶液中的微秒级分子动力学模拟中也表现出构象稳定性。作者进一步评估了建模/模拟流程过滤非实验性β折叠纤维结构的能力。因此,FibrilGen工具包提供了一条构建各种可能形态的原子级超分子肽结构的途径,用于可视化、模拟以及相互作用和稳定性的评估。 核心结论 FibrilGen是首个专门用于构建cross-β纳米纤维的原子级建模工具,支持杆状、带状、管状等多种形态 工具包集成在PyMOL中,可通过7个几何参数控制纤维结构,并自动精修以消除空间冲突 通过冷冻电镜验证,FibrilGen构建的HP8、AL1和Aβ42纤维结构与实验高度吻合 微秒级分子动力学模拟证实FibrilGen生成的结构在水溶液中300 K下稳定 工具能够识别并排除非实验性的纤维形态,为肽纳米材料的理性设计提供支持 背景 自组装肽纳米材料在过去二十年中引起了广泛关注。虽然最初主要研究其在阿尔茨海默病或帕金森病等疾病中的作用,但科学家们已经开始探索利用这些短天然分子的自组装特性来设计新型材料。在各种自组装肽中,β折叠形成肽在生物医学领域尤其受到青睐,因为它能够设计出生物相容性和剪切变稀的纤维水凝胶支架,在3D体外细胞和类器官培养、体内药物递送等应用中展现出巨大潜力。 cross-β结构的基本特征已为人所知:肽组装成单向的cross-β梯状结构,根据肽的相对取向可以是平行或反平行排列,片内主链肽间距为4.8-4.9 Å,并通过分子间氢键稳定。尽管在肽分子水平上组装相对简单,这些自组装肽可以形成具有多种形态的扩展超分子组装体,从细纤维到粗纤维、管状、带状和片状。 图1:cross-β纤维的常见周期性构建块 该图展示了β折叠双层(红框)作为cross-β纤维的周期性构建块:(a)12肽AL1(IGSNVVTWYQQL)形成6层堆叠的平行β折叠双层,组装成左手杆状形态;(b)AL1肽形成9层堆叠的平行β折叠双层,组装成左手杆状;(c)11肽(YTIAALLSPYS)形成平行β折叠,组装成左手管状;(d)8肽HP8(N端乙酰化、C端酰胺化的FKFEFKFE)形成平行或反平行β折叠,组装成左手管状。电子密度使用Chimera 1.17.3可视化。 尽管使用冷冻电镜、X射线衍射和固态核磁共振等最先进技术在阐明这些结构的形态方面做了大量工作,但肽序列与最终超分子结构形态之间的关联仍然知之甚少。不仅最终自组装结构取决于肽序列本身,介质pH值和离子强度、溶剂极性和温度等环境因素也在决定最终超分子组装体的形态中起着关键作用。 现有的软件包可以从实验中重建超分子组装体:例如RELION允许从冷冻电镜图像进行单颗粒分析以重建电子密度;ROSETTA提供刚体变换将分子组装成对称组装体以模拟NMR或冷冻电镜数据;PHENIX支持从X射线、中子衍射和冷冻电镜数据推断原子模型。对于不拟合实验约束的分子建模,有多种软件程序可用于将分子打包成特定的组装模式,如PACKMOL可以将分子组装成球体、椭圆体、圆柱体、平面或盒子;Polyply可以执行粗粒化珠子的自排除随机游走以生成聚合物构象;Nanomaterial Modeler包含一个晶胞库,可组装块状金属、矿物和碳质材料。虽然这些建模工具包对于构建分子组装体很有价值,但仍需要一个专门的工具来构建跨越广泛复杂实验观察形态的单向超分子cross-β排列。 关键科学问题 本文旨在解决的核心科学问题是:如何系统性地构建具有多样化形态的肽β折叠纳米纤维的原子级模型。尽管冷冻电镜和固态核磁共振等实验技术能够解析cross-β结构,但从肽序列到原子级三维纳米结构的建模过程仍然是一个挑战。现有的通用分子组装工具(如PACKMOL、Polyply)无法专门处理cross-β纤维独特的几何特征,包括: β折叠双层的特殊堆积方式(面对面或面对背) 片内肽链的平行/反平行排列 沿纤维长轴的螺旋扭曲 从简单杆状到复杂管状、带状的形态变化 这个问题之所以是研究焦点和难点,是因为:肽序列与最终纳米结构之间缺乏明确的构效关系,同时环境因素(pH、离子强度、温度)也会显著影响形态。一个能够快速生成、可视化和筛选不同形态的工具对于肽纳米材料的理性设计至关重要。 创新点 首个专门用于cross-β纤维建模的工具包:FibrilGen是为β折叠自组装肽纳米结构量身定制的,填补了通用分子组装工具的空白 参数化建模方法:通过7个几何参数($N, K, M, \theta_s, \theta_z, r_y, \theta_y$)系统性地控制纤维形态,涵盖杆状、带状、管状等多种结构 自动结构精修:内置迭代算法自动调整螺旋扭曲参数,消除原子间空间冲突,确保生成紧密且物理合理的组装体 与PyMOL无缝集成:可直接在PyMOL命令行调用,实现快速可视化和概念化 完整的建模-模拟-验证流程:从初始结构生成到能量最小化、微秒级MD模拟,提供端到端的解决方案 实验验证的可靠性:通过与HP8、AL1、Aβ42三个体系的冷冻电镜和固态NMR数据对比,证明了方法的准确性 研究内容 核心方法:FibrilGen建模流程 FibrilGen采用自底向上的层次化建模策略,将肽纳米纤维的构建分解为三个层次:单肽 → 2×2基本单元 → 完整纤维结构。 图2:FibrilGen建模方案 该图展示了FibrilGen中用户可控制的输入参数集合:(a)2×2单元的周期性基础和沿β折叠轴的重复数$N$;(b)2×2单元在纤维横截面上的堆积方式,使用矩阵$K$接触单元边缘,或使用重复数$M$和角度$\theta_s$接触单元角落;(c)绕β折叠轴的扭曲角$\theta_y$的符号、相对β折叠轴的倾斜角$\theta_z$(以及距β折叠轴的半径$r_y$)。用户可以指定堆积模式(通过$N, K, M, \theta_s$)和初始螺旋扭曲(通过$\theta_y, r_y, \theta_z$的符号),FibrilGen会精修螺旋扭曲并组装成紧密且无相交的纤维结构。 graph TD A["输入:单条肽链<br/>β折叠构象"] --> B["pep2unit脚本<br/>生成2×2基本单元"] B --> C["能量最小化<br/>AMBER ff14SB力场<br/>TIP3P水模型"] C --> D["提取中心单元<br/>作为装配基块"] D --> E{"选择形态类型"} E -->|杆状/片状| F["线性堆积<br/>参数N,K,θz,ry,θy"] E -->|带状/管状| G["旋转堆积<br/>参数N,M,θs,θz,ry,θy"] F --> H["自动精修<br/>迭代调整θz和ry<br/>消除空间冲突"] G --> H H --> I["生成最终结构<br/>PDB格式输出"] I --> J["PyMOL可视化<br/>MD模拟验证"] style A fill:#e1f5ff style D fill:#fff4e1 style H fill:#ffe1e1 style I fill:#e1ffe1 2×2基本单元的构建 FibrilGen的核心概念是2×2肽单元,即4条肽链组成的基本构建块,包含两个β折叠形成双层结构。 图3:2×2肽单元的组装 给定一条输入肽如(a)Ac-FKFEFKFE-NH2,pep2unit脚本可将肽排列成两个β折叠(绿色、橙色),具有以下选项:(b)两个β折叠在xz平面上的片间排列(片间距用粉色标注)可以是(左)面对背或(右)面对面;(c)相邻β链的片内排列,沿x轴的配准(蓝色)和沿y轴4.8 Å的位移(紫色);(d)反平行(标记为βa)和平行(标记为βp)β折叠的平行/反平行排列:两个反平行排列的βa(标记为βaaβa)、一个βp和一个βa反平行排列(标记为βpaβa)、两个反平行排列的βp(标记为βpaβp)、两个平行排列的βp(标记为βppβp)。此处以面对面排列的同向配准β折叠为例。 pep2unit脚本提供三个关键控制选项: 片间排列:两个β折叠在xz平面上的相对位置 面对背(face-to-back):一个折叠的”面”朝向另一个的”背” 面对面(face-to-face):两个折叠的疏水侧链相互接触 片内排列:相邻β链在同一折叠内的配准方式 同向配准(in-register):相邻链的残基一一对应 错位配准(out-of-register):相邻链沿x轴有偏移 平行性:β折叠的N端到C端方向 平行β折叠:所有链方向一致 反平行β折叠:相邻链方向相反 对于侧链的χ1二面角,采用简单策略:初始化为80°(靠近N端)或160°(靠近C端)以最大化侧链间距离。随后通过能量最小化精修侧链堆积。 图4:FibrilGen中的组装操作 该图展示了组装操作:(a)4肽基本组装单元(表示为盒子)通过仿射变换组装成纳米纤维;(b)引入称为线性堆积的操作来接触盒子的面,使用$K$在纤维横截面上排列基本单元或使用$N$延伸纤维长度;(c)引入称为旋转堆积的操作来接触盒子的边,使用半径$r_s$、扭曲角$\theta_s$将单元绕纤维轴堆积$M$次;(d)引入称为扭曲的操作来调整沿纤维轴盒子的面接触,使用半径$r_y$、扭曲角$\theta_y$和倾斜角$\theta_z$绕纤维轴旋转。 图5:FibrilGen中的基本形态模型 该图展示了基本形态模型:(a)通过线性堆积和扭曲构建的杆状模型基础;(b)扩展盒子堆积产生杆状模型的示例;(c)通过旋转堆积和扭曲构建的带状模型基础;(d)扩展盒子堆积产生带状模型的示例。 七个几何参数的定义 表1:FibrilGen的7个几何参数 参数 描述 杆状结构 带状结构 $N$ 沿纤维长轴延伸的单元数量 ✓ ✓ $K$ 在纤维横截面上的堆积模式矩阵(线性堆积) ✓ ✗ $M$ 在纤维横截面上旋转堆积的单元数量 ✗ ✓ $\theta_s$ 旋转堆积的角度间隔(度) ✗ ✓ $\theta_z$ 倾斜角,使单元偏离纤维轴(度) ✓ ✓ $r_y$ 孔径半径,单元距纤维轴的位移(Å) ✓ ✓ $\theta_y$ 扭曲角,沿纤维轴旋转连续单元(度)符号:+1为左手性,-1为右手性 ✓ ✓ 螺旋扭曲的数学关系: 为了保持相邻肽间的氢键距离,扭曲角 $\theta_y$、倾斜角 $\theta_z$ 和半径 $r_y$ 必须满足几何约束: \[(b \cdot \cos\theta_z)^2 + \left(r_y \cdot \sqrt{2 - 2\cos\theta_y}\right)^2 = b^2\] 其中,$b = 4.8$ Å是β折叠内相邻肽的间距常数。第一项是沿纤维长轴的投影距离平方,第二项是在横截面上旋转的弦长平方。 自动结构精修算法 FibrilGen的精修过程基于三个条件: 最小倾斜角:$\theta_z > \theta_{z,\min}$(默认1.14°),防止结构过于平坦 无空间冲突:$0 < \theta_y < \theta_{y,\max}$,其中 $\theta_{y,\max}$ 通过逐步增加扭曲角直到出现原子间距小于阈值来确定 适当的片间距离:相邻β折叠间的最近原子距离在2-5 Å之间 迭代过程: 对于杆状结构:从用户输入的 $\theta_z$ 开始,若不满足条件1和2,则以0.02 rad的步长逐步减小 $\theta_z$ 对于带状结构:同时调整 $\theta_z$(步长0.02 rad)和 $r_y$(添加≤1 Å的随机噪声),直到满足所有三个条件 最大迭代次数默认为40次。该算法确保生成的结构既物理合理又几何紧凑。 实验体系的重建与验证 作者选择了三个形态差异显著的实验体系来验证FibrilGen的能力。 体系一:HP8水凝胶管(10层β折叠) 图6:冷冻电镜电子密度与FibrilGen构建的cross-β纳米结构原子级模型的整体形态对比 该图展示了三个体系的冷冻电镜电子密度与FibrilGen构建模型的对比:(a)HP8水凝胶管——(左)电子密度EMD-23487,(右)FibrilGen模型结构;(b)AL1杆——(左)电子密度EMD-3128,(右)FibrilGen模型结构;(c)Aβ42杆——(左)电子密度EMD-3851,(右)FibrilGen模型结构。电子密度使用Chimera 1.17.3可视化,FibrilGen模型使用PyMOL可视化。 建模过程: 使用pep2unit生成平行+反平行面对面排列的2×2单元 构建含10条肽/折叠的初步纤维(共100条肽) 在显式水中能量最小化 提取中心单元重新组装 探索倾斜角范围:15°、20°、25°、30°、35° 精修结果:FibrilGen自动收敛到 $\theta_z = 25.0°$ 和 $\theta_y = 3.7°$,与实验值(30.0°和4.5°)吻合良好。 体系二:AL1杆状纤维(12层β折叠) AL1肽(IGSNVVTWYQQL)形成12层平行β折叠的杆状结构,固态NMR确认平行排列。如图1b所示,冷冻电镜电子密度图(EMD-3128)与FibrilGen构建的192肽模型在整体形态和螺旋参数上高度吻合,冷冻电镜分辨率为8.3 Å。 建模过程: pep2unit生成两个平行β折叠面对面排列的2×2单元 探索倾斜角:3°、5°、7°、9°、10° 构建192肽的双折叠杆状结构 精修结果:与HP8不同,AL1杆允许一系列螺旋扭曲,FibrilGen给出 $\theta_z = 11.0°$ 和 $\theta_y = 1.5°$,接近实验重建的12.2°和1.4°。 体系三:Aβ42淀粉样杆(2层β折叠) Aβ42肽是阿尔茨海默病的标志性淀粉样蛋白,组装成双折叠杆状结构,冷冻电镜分辨率4.0 Å。如图1c所示,冷冻电镜电子密度图(EMD-3851)与FibrilGen构建的44肽模型高度一致。该体系展示了FibrilGen能够处理复杂含有多个转角的肽分子,并准确重建其纳米纤维结构。 建模过程: 直接使用冷冻电镜结构(PDB: 5OQV)中的2×2单元,不做能量最小化 构建44肽的双折叠纤维 探索倾斜角:3°、5°、7°、9°、10° 精修结果:扭曲参数收敛到 $\theta_z = 3.5°$ 和 $\theta_y = 1.0°$,与实验值4.5°和1.4°非常接近。 三个体系的共同特点:FibrilGen模型在整体形态(管状、杆状)、螺旋参数($\theta_z$、$\theta_y$)和骨架堆积方式上均与实验高度一致,证明了该方法的普适性。 分子动力学模拟稳定性评估 为了验证FibrilGen生成结构的动力学稳定性,作者对三个实验体系(HP8管、AL1杆、Aβ42杆)以及HP8的冷冻电镜结构进行了微秒级MD模拟。 模拟参数: 力场:AMBER ff14SB(肽)+ TIP3P(水) 温度:300 K(Langevin恒温器,碰撞频率1 ps⁻¹) 压强:1 bar(Berendsen控压器,弛豫时间2 ps) 时间步长:4 fs(采用氢质量重分配HMR方法) 时长:每个体系2条1 μs轨迹 平衡策略: 能量最小化 升温至100 K(NVT,20 ps) 升温至300 K(NPT,400 ps) 短平衡(2 ns,平底谐振子约束相邻β链Cα距离在2-9 Å) 生产模拟(1 μs,无约束) 图7:300 K下1 μs MD模拟中的生成(重建)结构、平均骨架氢键数/链(Hbonds)和纤维半径$R_f$ 平衡前的结构为:(a)FibrilGen构建的HP8管、(d)冷冻电镜结构7LQI的HP8管、(g)FibrilGen构建的AL1杆、(j)FibrilGen构建的Aβ42杆。从MD副本(黄色、绿色)计算的氢键数/链(b, e, h, k)和纤维半径(c, f, I, l)分别列在第二行和第三行。还显示了从冷冻电镜结构7LQI计算的基线值(b,c,e,f中的蓝色)和冷冻电镜结构5OQV的基线值(k中的蓝色)。 HP8管的稳定性分析: 指标 FibrilGen模型(平均±标准差) 冷冻电镜结构(平均±标准差) 实验值 Cα RMSD(Å) 2.8和3.3(相对初始) 1.7和2.0(相对初始) - 骨架氢键数/链 13.2 ± 0.3 13.1 ± 0.3 7.8(初始冷冻电镜) 纤维半径Rf(Å) 28.3 ± 0.2 30.0 ± 0.5 30.0 x-配准tx(Å) 7.1 ± 0.3 7.0 ± 0.3 6.4 y-扭曲θd(°) 14.3 ± 2.1 19.1 ± 3.3 13.0 关键发现: FibrilGen模型和冷冻电镜结构在MD模拟中表现出相似的稳定性 氢键数量(13.2 vs 13.1)几乎相同,且均高于初始冷冻电镜结构(7.8),说明MD优化了氢键网络 纤维半径略有差异(28.3 Å vs 30.0 Å),可能源于不同的初始条件 管状形态在微秒尺度上保持稳定,未发生坍塌或解离 图8:300 K下副本微秒级MD模拟中肽链相对排列(x-配准$t_x$、y-扭曲角$\theta_d$)的时间序列 该图展示了(黄色、绿色)双重轨迹的时间序列:(a-c)FibrilGen构建的HP8管;(d-f)冷冻电镜结构7LQI的HP8管;(g-i)FibrilGen构建的AL1杆;(j-l)FibrilGen构建的Aβ42杆。蓝色表示实验值。四个体系的局部坐标系用于定义$t_x$和$\theta_d$,分别显示在(a)、(d)、(g)、(j)中。基线肽排列从冷冻电镜结构7LQI计算得出(b,c,e,f中的蓝色)以及从冷冻电镜结构5OQV计算得出(k,l中的蓝色)。 AL1杆的稳定性分析: 指标 FibrilGen模型(平均±标准差) 实验观察 Cα RMSD(Å) 3.4(相对初始) - 骨架氢键数/链 14.4 ± 0.4 固态NMR确认平行排列 纤维半径Rf(Å) 26.6 ± 0.0 冷冻电镜显示杆状形态 x-配准tx(Å) 0.0 ± 0.2 固态NMR示in-register排列 y-扭曲θd(°) 3.7 ± 1.0 固态NMR示左手扭曲 关键发现: 12层杆状结构在微秒模拟中形态稳定 x-配准接近0(-0.0 ± 0.2 Å),与固态NMR确认的in-register排列一致 左手扭曲角3.7°与实验推断的扭曲方向吻合 Aβ42杆的稳定性分析: 指标 FibrilGen模型(平均±标准差) 冷冻电镜结构(PDB 5OQV) Cα RMSD(Å) 2.4(相对FibrilGen初始)1.4(相对5OQV) 0.7(初始差异) 骨架氢键数/链 56.1 ± 0.7 54.0 纤维半径Rf(Å) 15.7 ± 0.1 N/A x-配准tx(Å) -0.1 ± 0.3 0.2 y-扭曲θd(°) 7.0 ± 3.9 2.5 关键发现: Aβ42单体含5个转角,部分片内骨架氢键较弱 氢键数(56.1)与冷冻电镜结构(54.0)接近 x-配准接近0,与固态NMR确认的in-register排列一致 扭曲角7.0°与实验值(约3°)的差异可能源于Aβ42复杂的五圈拓扑 稳定性总结:三个FibrilGen模型在300 K水溶液中经历微秒级模拟后,均保持了: 形态完整性(管状、杆状) 氢键网络稳定(每链13-56个骨架氢键) 几何参数一致(纤维半径、肽链配准、扭曲角) 这证明FibrilGen生成的原子级结构不仅几何合理,而且动力学稳定,可作为进一步研究的可靠起点。 假设性结构的筛选能力 为了评估FibrilGen/MD流程识别非实验性形态的能力,作者进行了”形态互换”实验:将HP8建模为杆状,将AL1建模为管状。 HP8杆的建模结果 作者构建了两种电荷状态的HP8杆: 带正电的HP8杆(所有谷氨酸质子化,pH 3) 电中性的HP8杆(所有谷氨酸去质子化,pH 7) 结果: 带正电HP8杆:能量最小化成功,但在平衡阶段解离(图S5a) 电中性HP8杆:平衡和生产模拟稳定,但收敛到交错排列(staggered arrangement)而非标准杆状 表2:HP8杆与HP8管的结构参数对比 结构 x-配准tx(Å) y-扭曲θd(°) 纤维半径Rf(Å) 氢键数/链 HP8管(实验) 7.1 ± 0.3 14.3 ± 2.1 28.3 ± 0.2 13.2 ± 0.3 HP8杆(中性) 0.0 ± 0.2 0.2 ± 2.2 25.7 ± 0.1 11.0 ± 0.6 HP8杆(带电) 不稳定 不稳定 不稳定 不稳定 关键发现: 电中性HP8杆的氢键数(11.0)显著少于HP8管(13.2),提示管状形态更稳定 扭曲角接近0°(0.2°),形成扁平结构,与AL1杆的3.7°和HP8管的14.3°形成对比 带电HP8杆的解离表明静电排斥阻止了杆状形态的稳定 AL1管的建模结果 作者尝试用AL1肽构建类似HP8的管状结构: 首先尝试组装平行+反平行混合的2×2单元(类似HP8管)→ 能量最小化失败(骨架氢键断裂,β折叠丧失) 改用AL1杆的2×2单元尝试旋转堆积(M=2,3,4,5)→ FibrilGen无法找到无冲突的几何排列(图S6a) 退而求其次,构建两层平行β折叠面对面排列的片状结构(图S6c) 表3:AL1片与AL1杆的结构参数对比 结构 x-配准tx(Å) y-扭曲θd(°) 纤维半径Rf(Å) 氢键数/链 AL1杆(实验) 0.0 ± 0.2 3.7 ± 1.0 26.6 ± 0.0 14.4 ± 0.4 AL1片(双层) 1.3 ± 0.3 0.6 ± 1.4 4.9 ± 0.0 13.6 ± 0.3 关键发现: AL1片的氢键数(13.6)略少于AL1杆(14.4),差异0.8个氢键/链 扭曲角显著降低(0.6° vs 3.7°),片状结构几乎无扭曲 管状形态在AL1体系中几何不可行,即使在宽松的FibrilGen条件下也无法生成 筛选能力的总结 graph TD A["FibrilGen/MD筛选流程"] --> B{"能量最小化<br/>2×2单元"} B -->|成功| C{"FibrilGen几何精修"} B -->|失败| F1["拒绝:<br/>AL1平行+反平行混合单元"] C -->|找到无冲突排列| D{"MD平衡"} C -->|无解| F2["拒绝:<br/>AL1管状M=2~5旋转堆积"] D -->|结构稳定| E{"生产模拟1μs"} D -->|解离/坍塌| F3["拒绝:<br/>带电HP8杆"] E --> G{"结构分析"} G -->|氢键数高<br/>扭曲角合理| H["可能的形态:<br/>HP8管,AL1杆,Aβ42杆"] G -->|氢键数低<br/>扭曲角异常| I["不太可能的形态:<br/>中性HP8杆,AL1片"] style F1 fill:#ffcccc style F2 fill:#ffcccc style F3 fill:#ffcccc style H fill:#ccffcc style I fill:#ffffcc FibrilGen/MD流程的三级筛选机制: 第一级:2×2单元能量最小化 排除骨架氢键无法形成的排列方式(如AL1的平行+反平行混合) 第二级:FibrilGen几何精修 排除存在严重空间冲突的堆积方式(如AL1的小半径管状结构) 第三级:MD平衡与生产模拟 排除静电不稳定的形态(如带电HP8杆) 识别氢键较少、扭曲异常的次优形态(如中性HP8杆、AL1片) 定量指标: 氢键数差异:实验形态(13.2-14.4个/链)vs 非实验形态(11.0-13.6个/链) 扭曲角差异:实验形态(3.7°-14.3°)vs 非实验形态(0.2°-0.6°) 这些结果表明,FibrilGen/MD流程能够部分识别非实验性形态,尽管不是所有非实验形态都会被完全排除(如电中性HP8杆和AL1片仍能稳定),但它们在氢键数和扭曲角上的差异提供了定量的稳定性指标。 FibrilGen的扩展应用 除了上述三个验证案例,FibrilGen还展示了构建多种形态的能力(详见支持信息图S10-S11),包括: 扁平片状结构:$\theta_z$ 和 $\theta_y$ 接近0 细杆状纤维:小的 $K$ 矩阵(如2×2)+ 中等 $\theta_y$ 粗杆状纤维:大的 $K$ 矩阵(如3×4)+ 小 $\theta_y$ 紧密管状结构:小 $M$ 值(如 $M=4$)+ 大 $\theta_s$(如90°) 宽松管状结构:大 $M$ 值(如 $M=10$)+ 小 $\theta_s$(如36°) 左手/右手螺旋:通过 $\theta_y$ 的符号控制(+1左手,-1右手) 结构分析工具 FibrilGen不仅能构建结构,还提供了轨迹分析功能: 纤维长轴拟合:通过线性回归将肽中心质量投影到长轴(y轴),计算纤维半径Rf 肽链相对取向:定义局部坐标系ref-i-j-i来量化: x-配准(tx):相邻肽沿x轴的位移,0表示in-register排列 y-扭曲(θd):相邻肽在xz平面的扭曲角,$\theta_d = \arctan(d_z/d_x)$ 氢键分析:统计骨架氢键数(N-O距离<3.5 Å,角度>135°) RMSD计算:对齐后的Cα原子对距离均方根偏差 这些分析工具在Supporting Information的analysis/文件夹中提供Python实现,可直接用于MD轨迹后处理。 Q&A Q1: FibrilGen如何处理不同肽序列的侧链多样性? A1: FibrilGen采用两步策略: 初始化阶段:对每个残基的χ1二面角使用简化规则(80°或160°),使同侧侧链Cβ间距最大化(7.3 Å) 精修阶段:通过AMBER力场的能量最小化(在TIP3P水和离子存在下)优化侧链堆积,自动解决空间冲突。对于复杂侧链,用户可以手动调整特定χ1值,或集成构象搜索工具(如SCWRL)进一步优化。该方法在HP8(含芳香族Phe/Tyr)、AL1(含大侧链Trp/Gln)和Aβ42(含多种残基类型)上均表现良好。 Q2: 为什么AL1允许多种螺旋扭曲,而HP8和Aβ42收敛到单一扭曲? A2: 这反映了不同体系的能量景观特征: AL1杆:12层平行β折叠的杆状结构具有较宽的能量阱,多种 $(\theta_z, \theta_y)$ 组合在FibrilGen的空间冲突筛选中都可行。例如 $(\theta_z=7°, \theta_y=1.0°)$ 和 $(\theta_z=11°, \theta_y=1.5°)$ 都不产生冲突。 HP8管:10层混合平行/反平行β折叠的管状结构具有更窄的能量阱,内壁和外壁的不同排列方式对几何参数更敏感,只有 $\theta_z≈25-30°$ 和 $\theta_y≈3-4°$ 能同时满足内外壁的氢键和侧链堆积要求。 Aβ42杆:双层结构且每个单体有5个转角,几何约束严格,导致参数空间窄。 未来的自由能计算可以量化不同扭曲的相对稳定性。 Q3: FibrilGen/MD流程能否预测环境因素(如pH、离子强度)对形态的影响? A3: 部分可以,但有局限性: 已展示的能力:通过对比带电(pH 3)和中性(pH 7)HP8杆,流程成功预测带电HP8因静电排斥而解离,这与实验上HP8在pH 4形成管状而非杆状一致。 局限性: FibrilGen本身是几何建模工具,不直接考虑pH或离子效应。这些需在MD模拟阶段通过质子化状态和离子浓度体现。 微秒级MD可能不足以观察pH诱导的形态转变(需毫秒至秒尺度)。 离子特异性效应(如Na+ vs Ca2+)需专门的离子参数和更长模拟。 建议工作流程:对于环境敏感的体系,可以使用FibrilGen生成多种候选形态 → 用不同质子化状态/离子浓度进行短MD筛选 → 对稳定的形态进行长时间模拟。 Q4: 本文的氢键数指标(实验形态13-14个/链,非实验形态11-13个/链)能否作为普遍的稳定性判据? A4: 谨慎使用,该指标有参考价值但非绝对: 支持证据:三个实验体系均显示高氢键数(HP8管13.2,AL1杆14.4,Aβ42杆56.1),而非实验形态氢键数较低(HP8杆11.0,AL1片13.6)。 局限性: 序列依赖:Aβ42因含5个转角,部分骨架无法形成氢键,其”正常”氢键数就低于理想β折叠。 形态依赖:管状结构的内外壁曲率可能影响氢键几何,不能直接与杆状比较。 力场依赖:AMBER ff14SB的氢键参数可能与其他力场(如CHARMM36m)不同。 建议用法:将氢键数与同序列、同形态的实验结构比较,而非跨体系比较。同时结合其他指标(RMSD、纤维半径、扭曲角)综合判断。 Q5: FibrilGen适用于哪些类型的肽体系,有何限制? A5: 适用范围: ✓ β折叠形成肽:核心设计目标,支持平行/反平行、in-register/out-of-register ✓ 短肽至中等长度肽:验证的例子为8-12残基,理论上可扩展到20+残基 ✓ 单向纤维形态:杆、管、带、片(长轴为y轴) ✓ 同质组装:所有肽为相同序列 限制: ✗ α螺旋或无规则卷曲肽:FibrilGen假设β折叠二级结构 ✗ 分支或网络结构:只支持单向延伸 ✗ 异质组装:需要不同序列的肽交替排列(但可通过手动修改PDB文件变通实现) ✗ 非肽组分:如脂质、DNA等,需与其他工具(如PACKMOL)结合使用 正在开发的功能(根据代码结构推测):支持侧链修饰(磷酸化、糖基化)的参数输入。 关键结论与批判性总结 潜在影响 加速肽纳米材料的理性设计:FibrilGen/MD流程将构建-可视化-模拟的时间从周缩短到小时,研究人员可以快速探索序列-形态关系 促进计算与实验的协同:工具生成的原子级模型可以直接与冷冻电镜密度、固态NMR约束比较,辅助实验数据解析 推动超分子手性的研究:FibrilGen对左手/右手螺旋的参数化控制为研究侧链结构与超分子手性的关系提供了计算平台 支持淀粉样蛋白的药物设计:Aβ42等疾病相关纤维的精确建模有助于设计β折叠破坏剂或稳定剂 拓展到其他β折叠体系:方法原则上可应用于蜘蛛丝蛋白、真菌朊病毒等天然β折叠纳米材料 局限性 能量评估的不完整性:流程主要依赖空间冲突和MD稳定性,缺乏系统性的自由能计算来排序不同形态的热力学稳定性。未来可集成伞形采样或元动力学方法。 时间尺度限制:微秒级MD虽能评估局部稳定性,但肽自组装的成核、生长和形态转变发生在毫秒至秒尺度,当前流程无法预测动力学路径。可能需要结合粗粒化模拟或机器学习势。 环境因素的简化:虽然MD包含pH(通过质子化)和离子浓度,但溶剂极性、温度梯度、界面效应(如气-液界面)等复杂因素未充分考虑。 假阳性风险:电中性HP8杆和AL1片虽然在MD中稳定,但实验未观察到。流程可能无法排除所有非实验形态,氢键数等指标需更多体系验证。 人工干预需求:侧链χ1角初始化、能量最小化中的约束设置等步骤仍需用户经验,自动化程度有待提高。 缺乏成核机制:FibrilGen从完整纤维结构入手,未涉及单体→寡聚体→纤维的早期组装阶段,这在实验上往往是形态决定的关键。 未来研究方向 多尺度建模整合:将FibrilGen与粗粒化方法(如Martini)结合,先用粗粒化快速探索组装路径,再用FibrilGen生成原子级结构进行精修 机器学习辅助设计:训练神经网络从序列直接预测最优几何参数 $N, K, M, \theta_s, \theta_z, r_y, \theta_y$,减少人工试错 自由能景观绘制:对关键体系(如HP8)系统性扫描 $\theta_z$-$\theta_y$ 空间,计算每个点的溶剂化自由能,绘制完整的形态相图 异质组装体建模:扩展FibrilGen以支持A-B-A-B型交替序列或共组装体系(如肽-脂质混合纤维) 实时冷冻电镜数据拟合:开发FibrilGen的反向建模模式,输入低分辨率电子密度,自动搜索最佳几何参数 计算机辅助突变设计:结合FibrilGen和Rosetta的序列设计模块,预测哪些突变能稳定特定形态或改变手性
Specific Sytems
· 2025-11-02
【cell】淀粉样纤维的结构并非一成不变,而是动态演化的生命体
【cell】淀粉样纤维的结构并非一成不变,而是动态演化的”生命体” 本文信息 标题: 淀粉样蛋白组装过程中纤维多态性的结构演化 作者: Martin Wilkinson, Yong Xu, Dev Thacker, Sheena E. Radford, Neil A. Ranson 等 发表时间: 2023年12月21日 单位: 利兹大学 (University of Leeds),英国 引用格式: Wilkinson, M., Xu, Y., Thacker, D., Taylor, A. I. P., Fisher, D. G., Gallardo, R. U., Radford, S. E., & Ranson, N. A. (2023). Structural evolution of fibril polymorphs during amyloid assembly. Cell, 186(26), 5798–5811.e7. https://doi.org/10.1016/j.cell.2023.11.025 数据与代码: CryoEM数据集: EMPIAR: 11714, 11715, 11716, 11717 CryoEM电镜图: EMDB: 15696, 15728, 15729, 15730, 15731, 15753, 15754, 15755, 15756 原子坐标: PDB: 8AWT, 8AZ0, 8AZ1, 8AZ2, 8AZ3, 8AZ4, 8AZ5, 8AZ6, 8AZ7 原始数据: University of Leeds Data Repository: https://doi.org/10.5518/1230 摘要 冷冻电子显微镜(cryo-EM)为我们理解包括疾病相关蛋白在内的淀粉样纤维结构提供了前所未有的视角。然而,这些已解析的结构通常代表了漫长组装过程的终点产物,它们与组装早期的纤维之间的关系仍然未知。因此,在组装过程中是否会形成具有不同结构和潜在不同病理特性的纤维,一直是一个悬而未决的问题。本研究利用cryo-EM技术,在体外解析了一种与疾病相关的人胰岛淀粉样多肽(IAPP-S20G)在纤维化过程不同时间点的纤维结构。惊人的是,在迟滞期、增长期和平台期形成的纤维具有截然不同的结构,随着纤维化进程的推进,新的构象不断出现,而另一些则会消失。对野生型hIAPP的时间序列研究也显示了类似的纤维结构随时间变化的现象,表明这是IAPP淀粉样蛋白组装的一个普遍特性。这项关于瞬时存在的纤维结构的发现,对于理解淀粉样蛋白的组装机制具有重要意义,并可能为揭示疾病中淀粉样蛋白的演进过程提供新的见解。 背景 淀粉样纤维的形成,被誉为“蛋白质折叠的阴暗面”,是众多人类重大疾病的共同病理标志,包括阿尔茨海默病(AD)、帕金森病(PD)以及2型糖尿病(T2D)。这些疾病的特征是,原本可溶的功能性蛋白质错误折叠,并自发聚集成不溶性的、富含标志性“交叉β-折叠”(cross-β)结构的纤维状沉积物。这一过程通常遵循一个经典的“成核-生长”动力学模型,表现为典型的S型曲线,包含反应初期的迟滞期(lag phase)、纤维快速增长的增长期(growth phase)和反应达到平衡的平台期(plateau phase)。 近年来,随着冷冻电镜(cryo-EM)技术的革命性突破,科学家们解析了大量高分辨率的淀粉样纤维结构。这些研究揭示了一个惊人的事实:同一条多肽链可以折叠成多种不同的三维结构,这种现象被称为结构多态性(polymorphism)。这表明淀粉样蛋白的聚集并非简单的线性过程,而是在一个崎岖的能量景观上,通过复杂的分子事件级联发生的。不同的多态性结构(或称为“株”,strains)可能具有不同的生物毒性和传播能力,这被认为是解释同一种蛋白却能导致不同临床表型疾病(如α-突触核蛋白在PD和多系统萎缩症中的不同表现)的分子基础。 然而,当前几乎所有已报道的淀粉样纤维高分辨率结构,无论是从患者脑组织中提取的(ex vivo),还是在实验室中重组的(in vitro),都只捕捉了单个时间点的快照,这个时间点通常代表了疾病的终末期或体外反应的终点。这留下了一个巨大的知识空白:在漫长的聚集过程中,纤维的结构是否始终如一?或者,是否存在一些只在特定阶段出现的、瞬时存在的中间态纤维结构?这些早期的、可能转瞬即逝的结构,是否可能具有独特的、甚至更强的生物学危害性,却因为在终点时消失而被我们长期忽略?解答这些问题对于从根本上理解淀粉样蛋白的形成机制和疾病进展至关重要。 关键科学问题 本研究旨在解决淀粉样蛋白领域一个长期存在且至关重要的核心问题:淀粉样纤维的结构多态性在聚集反应的整个时间进程中是恒定的,还是会随着时间动态演化? 具体来说,研究团队试图通过高分辨率的结构生物学手段,直接“目睹”并回答以下几个层层递进的问题: 在聚集反应的迟滞期、增长期和平台期,优势的纤维结构是否相同? 是否存在一些只在特定阶段(尤其是早期)出现的瞬时纤维物种,它们在反应后期会消失或被其他结构取代? 如果纤维结构确实在演化,那么这种演化遵循什么样的规律?是否存在从一种结构到另一种结构的结构谱系(structural lineages)? 驱动这种结构演化的 underlying 物理化学和动力学机制是什么?是动力学控制(谁长得快谁就占优)还是热力学控制(谁最稳定谁就占优)在主导不同阶段的演化? 创新点 首次实现多时间点结构解析:首次通过高分辨率冷冻电镜技术,在同一聚集反应的不同时间点(迟滞期、增长期、平台期)对淀粉样纤维进行结构解析,将研究从静态终点推向了动态过程。 直接证实动态演化:提供了直接的、原子分辨率的证据,证明了淀粉样纤维多态性是动态演化的,颠覆了过去将纤维视为静态终产物的传统观念。 发现多种瞬时与全新结构:在IAPP-S20G的聚集过程中,总共解析了七种不同的纤维多态体结构,其中五种是全新的,并发现了一些仅在早期或中期存在的瞬时结构。 提出结构演化模型:基于详实的结构和动力学数据,提出了一个整合了动力学控制和热力学驱动的纤维结构演化模型,为理解不同阶段优势多态体的转变提供了合理的机制解释。 研究内容 核心方法:多时间点冷冻电镜结构解析 为了捕捉淀粉样纤维在组装过程中的动态变化,研究团队设计了一套严谨的实验流程。他们以与早发型2型糖尿病相关的IAPP-S20G突变体为模型,在体外进行静态孵育,模拟其自发聚集过程。 时间点采样:基于硫黄素T(ThT)荧光(一种检测淀粉样纤维的常用染料)和高效液相色谱(HPLC)对反应进程的监测,研究人员精心挑选了三个代表性的时间点进行采样: 3周(迟滞期后期):此时ThT信号很低,但已有少量可沉淀的纤维形成。 6周(增长期中段):ThT信号快速上升,是纤维大量形成和增殖的阶段。 22周(平台期):ThT信号达到饱和,反应进入表观上的稳态。 结构解析流程:对每个时间点的样品,研究团队都进行了冷冻电镜数据采集和复杂的图像处理分析。 graph TD subgraph "实验流程" direction LR A("IAPP-S20G<br/>单体溶液") --> B("静态孵育<br/>(室温,pH 6.8)"); B --> C1("3周采样<br/>(迟滞期)"); B --> C2("6周采样<br/>(增长期)"); B --> C3("22周采样<br/>(平台期)"); end subgraph "数据处理流程" direction LR D("冷冻制样<br/>&<br/>Cryo-EM数据采集") --> E("2D分类<br/>(识别不同形态的纤维)"); E --> F("3D分类<br/>(分离不同多态体)"); F --> G("高分辨率<br/>三维重构"); G --> H("原子模型搭建<br/>与精修"); end C1 --> D; C2 --> D; C3 --> D; 通过对数百万个纤维片段图像进行分类和重构,他们得以在原子分辨率水平上解析出每个时间点存在的主要纤维结构。 实验结果与分析:一场动态的结构演化“接力赛” 研究结果戏剧性地揭示了IAPP-S20G纤维群体的结构组成在不同阶段发生了深刻的演变,如同场上选手不断更替的接力赛。 图1:淀粉样纤维多态性组装的可能模型。 (A-B) 先前研究解析的野生型hIAPP和IAPP-S20G纤维结构。(C-D) 两种理论模型:(C) 平行组装模型,不同多态体同时独立生长;(D) 序贯组装模型,一种多态体可能催化另一种的形成。下方的示意图表明,宏观的ThT生长曲线(品红色)可能掩盖了单个多态体(红色和蓝色)复杂的、截然不同的组装过程。 图2:IAPP-S20G纤维群体随时间的初步表征。 (A) ThT荧光(红色)和上清液中剩余单体浓度(蓝色)的时间进程图,标示了迟滞期、增长期和平台期。有趣的是,早期聚集体对ThT的响应较弱。(B) 代表性的负染电镜图像显示了3周、6周和22周时纤维形态的多样性。(C) 负染电镜图像中测量的纤维交叉周期距离分布热图,显示了不同时间点纤维形态的演变。早期(2-3周)的纤维大多是无扭曲的。 迟滞期(3周):瞬时先驱者的出现 在反应的早期阶段,电镜下观察到的大部分纤维(约68%)是没有规则扭曲的直线状纤维,其结构无法通过常规的螺旋重构方法解析。然而,在剩余约32%的有规则结构的纤维中,研究人员解析出了一种全新的、从未报道过的结构。 2PFP结构:这是一种由两条原纤维(2PF)构成的纤维,每条肽链折叠成独特的P形(P-fold),因此被命名为2PFP。 结构特征:它的交叉周期约为21 nm,与野生型(WT)IAPP纤维(约25 nm)相似。更有趣的是,尽管整体折叠不同,2PFP与WT IAPP纤维在残基15-28区域共享相似的主链构象,并且具有保守的原纤维间相互作用界面。 图3:不同组装阶段存在不同的IAPP-S20G纤维群体。 (A) 3周、6周和22周的代表性冷冻电镜图像。(B) 每个时间点数据集的2D分类平均图,按交叉周期距离对不同的多态体进行颜色编码。(C) 精选的2D分类平均图,展示了初步识别出的不同规则纤维形式及其交叉周期。 图4:Cryo-EM结构解析揭示了在组装的不同阶段,多种IAPP-S20G纤维多态体的差异性分布。 (A, E, H) 3周、6周和22周数据集中所有纤维片段的多态体分布饼图。(B, F, I) 每个多态体最终电镜密度图的切片视图。(C, G, K) 每个数据集中解析出的各多态体核心和表面视图。(D) 3周的2PFP结构(深绿)与WT IAPP的2PFS结构(浅绿)叠加,显示了它们共享的保守核心(蓝/红高亮)和相互作用界面。(J) 22周的2PFL电镜图中,清晰可见一个有序的水分子通道(红球)。 这个2PFP结构是本次演化大戏的“开场角色”,但它也是一个瞬时存在的“先驱者”。 增长期(6周):多态性的大爆发 到了反应的增长期,纤维的景象发生了翻天覆地的变化。 2PFP的消失:在6周的样品中,迟滞期出现的2PFP结构几乎完全消失(占比<1%)。 六种新结构登场:取而代之的是一个高度复杂的混合体,研究人员从中成功解析出了四种高分辨率结构,并识别出另外两种稀有结构。这些结构可以被归类为两个主要的结构谱系(lineage): C-谱系:基于一个共同的、由C形折叠(C-fold)肽链构成的双原纤维核心(2PFC)。这个核心可以进一步吸附新的肽链,形成三原纤维的3PFCU和四原纤维的4PFCU。其中,2PFC和3PFCU是先前研究在终点样品中发现的结构,而4PFCU是本次发现的新结构。 L-谱系:基于一个由L形折叠(L-fold)肽链构成的双原纤维核心(2PFL)。L-fold与早期的P-fold在结构上最为相似。此外,还存在一个由2PFL核心和另外两条肽链组成的四原纤维结构4PFLU。 图5:纤维化时间进程中观察到的不同IAPP-S20G纤维结构和亚基折叠。 (A) 解析出的七种独特IAPP-S20G纤维结构,按其核心分为P-谱系、L-谱系和C-谱系。(B) 五种不同的亚基折叠构象:P-fold, L-fold, C-fold, U-fold, 和 J-fold。(C) 五种折叠在保守区域的叠加。(D) 2PFL和2PFP的叠加,显示了它们虽然共享一个相似的链构象,但第二条链的堆叠方式完全不同,形成了不同的纤维架构。(E, F) L-谱系和C-谱系内部各成员的叠加,显示它们共享一个保守的2PF核心。 在这一阶段,2PFC和2PFL是两种最主要的结构,各占约30%,而由它们衍生出的更大结构(3PF和4PF)占比较低。 平台期(22周):向更大、更稳定的结构成熟 当反应进入平台期,纤维群体的多样性再次降低,显示出一种“优胜劣汰”的成熟过程。 瞬时物种的淘汰:增长期出现的2PFC和3PFCU结构完全消失。 优势物种的富集:L-谱系的2PFL和4PFLU的比例显著增加,分别达到43%和19%,成为绝对的优势物种。C-谱系中只有最大的4PFCU得以保留(15%)。 新结构的发现:由于4PFLU的富集,研究人员得以解析其高分辨率结构。此外,还发现了一个占比仅2%的、结构更为独特的四原纤维结构4PFLJ,其外部两条肽链呈现一种全新的J形折叠(J-fold)。 图6:IAPP-S20G纤维多态体在组装时间进程中的结构成熟总结。 (A) 各多态体在不同时间点的分布百分比,背景为ThT荧光曲线。(B) 各亚基折叠类型在不同时间点的分布。(C) 负染电镜测量的交叉周期分布,显示纤维整体上变得更“长”(交叉周期更大)。(D) 不同尺寸(2PF, 3PF, 4PF)纤维的分布,显示了从2PF向4PF的转变。(E) 基于结构计算的每层纤维的平均自由能(ΔG°/layer),显示了随着时间推移,纤维整体变得更稳定。(F) 各谱系在不同时间点的演化示意图。 总的来看,整个聚集过程呈现出一个清晰的演化趋势:从早期形成的、较小的(2PF)、动力学上优先的瞬时结构,演变为中期的多样化结构混合体,最终成熟为尺寸更大(4PF)、热力学上更稳定的少数优势结构。 结果逻辑与机制推演 为了解释这种复杂的结构演化现象,研究者提出了一个基于动态变化的动力学景观的模型。 图7:IAPP-S20G多态体演进的卡通总结与提出的不同组装阶段动力学景观机制。 (A) 结合了结构信息的ThT曲线,展示了不同阶段的物种比例。(B) 基于结构和出现顺序提出的潜在组装路径示意图。该模型假设了亚基的逐步吸附(accretion)机制,即在已形成的2PF核心上添加新的肽链形成3PF和4PF结构。(C) 不同组装阶段的示意性能量景观图。在迟滞期,能量景观可能比较简单,2PFP是动力学上最容易形成的低谷。进入增长期,随着纤维表面的出现,由二次成核主导的路径被激活,能量景观变得复杂,出现了多个能量相近的低谷(C-谱系和L-谱系)。在平台期,反应趋于平衡,体系缓慢地向能量更低的、更稳定的4PF结构演化。 graph LR subgraph "迟滞期 (Lag Phase)" direction LR Monomer("单体<br/>(高浓度)") --"初级成核<br/>(动力学控制)"--> Untwisted("无扭曲纤维<br/>(结构未知, 68%)"); Monomer --"初级成核<br/>(动力学控制)"--> P_2PFP("<b>2PF<sup>P</sup></b><br/>(P-fold, 32%)<br/>**瞬时先驱**"); end subgraph "增长期 (Growth Phase)" direction LR FibrilSurface("纤维表面<br/>(低单体浓度)") --"二次成核<br/>(动力学/热力学竞争)"--> L_Lineage("<b>L-谱系</b><br/>2PF<sup>L</sup> (30%)<br/>4PF<sup>LU</sup> (4%)"); FibrilSurface --"二次成核<br/>(动力学/热力学竞争)"--> C_Lineage("<b>C-谱系</b><br/>2PF<sup>C</sup> (30%)<br/>3PF<sup>CU</sup> (10%)<br/>4PF<sup>CU</sup> (7%)"); end subgraph "平台期 (Plateau Phase)" direction LR Equilibrium("长时间孵育<br/>(热力学驱动)") --> Final_L("<b>L-谱系主导</b><br/>2PF<sup>L</sup> (43%)<br/>4PF<sup>LU</sup> (19%)<br/>4PF<sup>LJ</sup> (2%)"); Equilibrium --> Final_C("<b>C-谱系残留</b><br/>4PF<sup>CU</sup> (15%)"); end P_2PFP --"消失"--> FibrilSurface; L_Lineage --"成熟/富集"--> Final_L; C_Lineage --"部分消失,部分富集"--> Final_C; 这个模型的核心思想是,驱动纤维形成的微观机制在不同阶段是不同的。在迟滞期,单体浓度高,纤维浓度低,初级成核占主导,这有利于形成那些成核势垒最低、形成速度最快的结构(如2PFP)。进入增长期后,大量纤维表面出现,二次成核(在已有纤维表面催化新纤维的形成)成为主导,其速率比初级成核快了$10^8$倍。这开启了通往C-谱系和L-谱系的新路径,它们可能在二次成核上更具优势,从而迅速取代了2PFP。最后,在漫长的平台期,随着单体被大量消耗,反应接近平衡,热力学稳定性成为主导因素,体系缓慢地向能量更低的、由更多亚基组成的4PF结构演化。 Q&A Q1: 为什么早期的纤维(迟滞期)不怎么与ThT荧光染料结合? A1: 这强烈暗示了早期纤维与后期纤维在结构上的根本不同。ThT染料的荧光来自于它嵌入到成熟淀粉样纤维的交叉β-折叠结构中的特定沟槽。迟滞期大量存在的无扭曲纤维和独特的2PFP结构,可能缺乏这种适合ThT紧密结合的构象,导致荧光信号很弱。这提醒我们,单独依赖ThT可能无法准确监测淀粉样蛋白聚集的全过程,尤其会低估早期物种的形成。 Q2: 文中提出的“C-谱系”和“L-谱系”是如何定义的?它们之间可以相互转化吗? A2: 这两个谱系是根据构成其双原纤维(2PF)核心的肽链折叠方式来定义的。C-谱系的核心是两条C形折叠的肽链(2PFC),而L-谱系的核心是两条L形折叠的肽链(2PFL)。本文的叠加分析显示,每个谱系内部的更大结构(3PF和4PF)都是在共享的2PF核心上通过“吸附”新的肽链形成的。研究没有提供L-谱系和C-谱系之间直接相互转化的证据,它们似乎是在增长期通过二次成核平行出现的两条演化路径。 Q3: 为什么在反应后期,纤维会趋向于形成更大(更多原纤维)的结构? A3: 这背后是热力学的驱动力。研究团队通过计算发现,虽然构成不同纤维的单个肽链折叠(P-fold, L-fold, C-fold等)在每个残基的平均稳定性上相差无几(约$-0.8\ \mathrm{kcal/mol}$),但由更多肽链组成的纤维(如4PF)在每一层结构上的总稳定性要显著高于较小的纤维(2PF)。因此,在反应后期,当体系有足够的时间去探索各种可能性时,它会自发地向能量更低的、更稳定的状态演化,即形成更大的4PF组装体。 Q4: 这项研究对野生型(WT)IAPP也有意义吗?它对理解人类疾病有什么启示? A4: 是的。研究团队对WT hIAPP也进行了类似的时间序列实验,同样观察到了纤维结构随时间演变的现象,从早期的无定型结构转变为后期更均一的、有特定结构的群体。这表明纤维的动态成熟是一个普遍现象,而不仅仅是S20G突变体的特性。这对疾病研究有重大启示:在疾病的早期阶段,可能存在一些结构独特、毒性不同的瞬时纤维物种。我们目前从晚期患者身上看到的纤维结构可能只是“幸存者”,而真正的“始作俑者”可能早已消失。未来的诊断和治疗策略或许需要考虑这些早期、瞬时的病理结构。 关键结论与批判性总结 核心结论 淀粉样纤维多态性是动态演化的:淀粉样纤维的结构在聚集过程中并非一成不变,而是经历了一个从动力学优先的瞬时物种到热力学稳定的成熟物种的复杂演化过程。 瞬时纤维物种的存在:在IAPP-S20G的聚集早期(迟滞期)存在一种独特的2PFP多态体,它在反应进入增长期后几乎完全消失。 结构演化的阶段性:迟滞期、增长期和平台期分别由不同结构特征的纤维群体主导,多样性在增长期达到顶峰,在平台期又趋于简化。 向更大、更稳定结构的成熟:随着反应的进行,纤维组装体有明显的趋势变得更大(从2PF到4PF)和更稳定,这是由热力学驱动的。 机制解释:这种演化可以通过一个动态的能量景观模型来解释,其中初级成核和二次成核在不同阶段扮演主导角色,分别青睐动力学上易于形成和热力学上更稳定的结构。 批判性总结 潜在影响: 颠覆性认知:这项工作从根本上改变了我们将淀粉样纤维视为静态终点的看法,揭示了其组装过程的动态性和复杂性,为整个领域提供了新的理论框架。 疾病机理新视角:提示我们疾病早期可能存在独特的、具有不同病理活性的瞬时纤维物种,这可能对解释疾病的起始和早期进展至关重要。 药物研发新思路:为药物开发提供了新的靶点思路。例如,可以设计特异性稳定无毒早期物种或抑制向有毒物种转变的药物,而不是仅仅靶向终末期的纤维。 研究局限性: 体外研究:研究是在简化的体外缓冲液系统中进行的,缺乏细胞内复杂的环境因素(如分子伴侣、脂质膜、拥挤效应等),这些因素可能会极大地影响纤维的演化路径。 转化机制未知:研究观察到了不同多态体的“此消彼长”,但无法确定其转化的具体分子机制,例如,是一种结构直接重塑为另一种,还是需要先解聚成单体再重新组装。 定量分析的挑战:由于淀粉样蛋白聚集反应的随机性和异质性,精确量化不同时间点各多态体的比例仍然是一个技术挑战,文中的百分比是基于大量图像统计的近似值。 未来研究方向: 实时追踪:开发能够实时、单分子水平上追踪单个纤维结构演变的技术(如结合特殊荧光探针的高速AFM或冷冻电镜断层成像),以直接观察结构转化过程。 生物学相关性:研究不同时间点形成的纤维物种的生物学活性,包括它们的细胞毒性、传播能力(种子活性)以及与细胞成分的相互作用。 体内验证:在细胞模型或动物模型中探究淀粉样纤维是否也存在类似的结构成熟过程,这将是验证该发现在生物学上重要性的关键一步。
Specific Sytems
· 2025-10-07
<
>
Touch background to close